AI资讯新闻榜单内容搜索-DeepSeek V

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek V
突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

一早起来,看到群里炸了锅!主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)

来自主题: AI资讯
8728 点击    2025-08-26 10:14
仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本,全新强化学习范式让30B轻松击败671B的DeepSeek V3

蚂蚁技术研究院联合浙江大学开源全新强化学习范式 Rubicon,通过构建业界最大规模的 10,000+ 条「评分标尺」,成功将强化学习的应用范围拓展至更广阔的主观任务领域。用 5000 样本即超越 671B 模型,让 AI 告别「机械味」。

来自主题: AI技术研报
5719 点击    2025-08-25 10:08
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了,新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。

来自主题: AI资讯
6669 点击    2025-08-22 18:54
手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。

来自主题: AI资讯
6528 点击    2025-08-22 18:13
实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。

来自主题: AI产品测评
8497 点击    2025-08-21 10:49
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。

来自主题: AI资讯
7023 点击    2025-08-20 12:56
刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本,实测有进步,在编程等个别场景可硬刚GPT-5

没等到Deepseek R2,DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点,上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始,鲸哥以为从V3升级到V 3.1,以为是不大的升级,鲸哥体验下来还有惊喜。

来自主题: AI资讯
8441 点击    2025-08-20 03:37
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。

来自主题: AI资讯
8696 点击    2025-07-23 09:09
Kimi K2里找到了DeepSeek V3架构

Kimi K2里找到了DeepSeek V3架构

Kimi K2里找到了DeepSeek V3架构

Kimi新模型热度持续高涨ing!

来自主题: AI资讯
6811 点击    2025-07-15 13:16
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?

来自主题: AI资讯
8194 点击    2025-07-09 15:30